課程資訊
課程名稱
心理計量驗證
Psychometric Examination 
開課學期
110-1 
授課對象
醫學院  職能治療學研究所  
授課教師
謝清麟 
課號
OT5016 
課程識別碼
429 U0260 
班次
 
學分
2.0 
全/半年
半年 
必/選修
選修 
上課時間
星期四3,4(10:20~12:10) 
上課地點
公職治431 
備註
限碩士班以上
總人數上限:20人 
 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本課程將涵蓋以下 7項重點:
1. 評估工具之於 臨床與學術研究 之價值
2. 心理計量特性之 分類與困境
3. 評估工具心理計量驗證之研究設計、資料分析與解讀
4. 傳統評估工具之發展與修改
5. 評析某一評估工具之心理計量特性與不足
6. 依據5之不足,提出後續可能研究之主題與研究設計
7. 下一世代評估工具之願景 

課程目標
主要目標:
1. 釐清評估工具之臨床與學術價值以及為何臨床人員少用標準化評估工具
2. 釐清心理計量特性之概念與價值
3. 培養閱讀與評析相關論文之能力,以利評論現有工具/文獻之不足,進而找出研究議題,嘗試解決臨床工具之問題
4. 培養解讀心理計量特性數據之能力

次要目標:
1. 培養相關資料分析能力
2. 培養心理計量驗證相關研究設計之能力
3. 培養撰寫相關論文之能力 
課程要求
1. 課前務必詳讀指定閱讀,並列出問題/疑惑,再於課堂釐清之(類似翻轉教學)。詳課程進度表之討論議題/重點。
2. 於期限內挑選指定心理計量特性驗證論文,並上傳至雲端資料夾,再評析/討論/彙整之。以1~2位同學一組(於第1堂課時討論決定之,若有困難,隨時提出)負責報告/帶領討論(每堂課2-4篇,詳各授課日期之心理計量特性與同學安排)[課前3-4天,請找老師討論內容與時間分配,2位同學口頭報告總時間勿超過40分鐘,另主持討論40分鐘。2位同學報告之主題,報告內容/分工上請同學自行協調,內容(尤其是概念、研究設計與資料分析特性等)需避免重複,宜再找老師確認。] 【雲端資料夾有前2年同學選擇之文獻,同學若找不到更合適的,亦可挑選之。】
3. 期末報告:彙整/報告一種常用評估工具之心理計量特性與不足,提出後續可能研究之主題與研究設計。含口頭報告與書面報告(至多2頁,以段落/完整句子書寫,非條例式,可製圖表呈現。若有圖表含文字,也是2頁)。
書面報告內容含主題、該工具簡介(內容與潛力)不足、研究目的、研究設計與資料分析。
4. 每堂課前可能安排 open book 小考,勿遲到。 
預期每週課後學習時數
 
Office Hours
每週四 12:30~13:30 備註: 可用 Skype (ID: clhsiehntu) or Line (33668177) 約時間 
指定閱讀
 
參考書目
詳各課堂 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
課堂小考 
20% 
 
2. 
課堂參與 
20% 
 
3. 
書面報告 
30% 
 
4. 
口頭報告 
30% 
 
 
課程進度
週次
日期
單元主題
第1週
9月23日  評估工具與相關研究(工具發展與驗證)之重要性
討論議題:
1. 評估工具之學術與臨床價值為何?
2. 現有評估工具有那些不足?
3. 為何臨床人員/病人似乎不重視評估?
4. 臨床經驗可以取代評估?
5. 後續評估工具還有那些重要研究議題?
6. 評估工具之發展與驗證流程為何?[新增]
7. 需要多久/多少研究才能解決上述議題?
8. 你不改善/發展工具,有人會做嗎?你要等待嗎?會等多久? 
第2週
9月30日  心理計量特性之分類學與困境
討論議題:
1. 如何解決心理計量特性分類與解釋未能統一之議題?
2. 評估工具有哪些常用/實用價值
3. 評估工具若欲具備上述各種常用/實用價值,需要那些心理計量特性? 
第3週
10月7日  討論議題:
1. 評估工具若依據功能分類,有那些類型?
2. 承上各類型評估工具有何特定價值?
3. 評估工具有那些常用/實用價值?
4. 為何需要發展新的評估工具?
5. Barthel index 如何被發展/應用/驗證?
6. ADL 評量何難之有?

後續報告內容、形式確認 
第4週
10月14日  【病歷之改良與研究議題】以及老師的【評估工具心理計量驗證、改良與發展之歷程】 
第5週
10月21日  Reliability (students a and b):
Internal consistency (Cronbach's alpha)
Item-level test-retest/inter-rater agreement (Kappa, weighted kappa) 
第6週
10月28日  Reliability (c/d):
Scale-level test-retest/inter-rater agreement/association (ICC/ Pearson r) 
第7週
11月4日  e/f
Systematic bias (paired t-test)Reliability
Limits of agreement and heteroscedasticity (Bland-Altman plot)
Random Measurement error (SEM/MDC) 
第8週
11月11日  Validity (a/b):
Relevance/readability: Content/face validity
Association (eg, Pearson r): concurrent validity 
第9週
11月18日  Validity(c/d):
Association (Pearson r): convergent/divergent (construct) validity
Difference (eg, ANOVA): discriminant validity 
第10週
11月25日  Validity (e/f):
Association (Pearson r): predictive validity
Association (Pearson r): ecological validity 
第11週
12月2日  Validity (博後 + student?)
* Unidimensionality (eg, Guttman scaling, IRT) 
第12週
12月9日  Validity (博後 + student?):
Factorial construct (EFA, CFA): construct (structural) validity 
第13週
12月16日  a/b
Responsiveness: ability of an outcome measure to detect change
Group level
The extent of change (effect size, SRM)
The statistically significant change (paired t-test) 
第14週
12月23日  Responsiveness (博後 + student)
* Individual level
Beyond measurement error (eg, MDC) 
第15週
12月30日  c/d
Interpretability (MID): for outcome measures 
第16週
1月6日  期末報告:TBD
彙整/報告一種常用評估工具之心理計量特性與不足,提出後續可能研究之主題與研究設計 I
搜尋一種常用、特定評估工具於特定族群之心理計量特性,彙整其心理計量特性,凸顯其心理計量特性不足,再提出後續可能研究之主題與研究設計。請以該工具之常用用途 (如outcome measure or screener等)所需之心理計量特性為主要評論與驗證議題。也就是,若一種工具常被使用為 outcome measure, 則勿評論其 screening 效能。 
第17週
1月13日  報告者:TBD
彙整/報告一常用評估工具之心理計量特性與不足,提出後續可能研究之主題與研究設計 II